Microarray dna là gì? Các bài nghiên cứu khoa học liên quan
Microarray DNA là kỹ thuật dùng chip chứa hàng nghìn probe oligonucleotide cố định, cho phép đo tín hiệu lai huỳnh quang để phân tích biểu hiện gen hoặc đột biến di truyền. Kỹ thuật này dựa trên lai đặc hiệu giữa probe cố định và mẫu đánh dấu huỳnh quang, hỗ trợ nghiên cứu biểu hiện gen toàn bộ hệ gen và phân tích đa hình SNP.
Khái niệm microarray DNA
Microarray DNA là kỹ thuật phân tích đồng thời hàng nghìn đến hàng chục nghìn đoạn DNA (probe) cố định trên bề mặt rắn như kính hoặc chip silicon, phục vụ cho việc đo lường mức độ biểu hiện gen hoặc sự hiện diện của các đoạn gen mục tiêu trong mẫu thử. Mỗi probe tương ứng với một vùng gen xác định, cho phép khảo sát rộng rãi toàn bộ hệ gen hoặc một tập con gen quan tâm trên cùng một vi mảng.
Về bản chất, microarray DNA tận dụng hiện tượng lai (hybridization) đặc hiệu giữa probe cố định và mẫu đối chứng được đánh dấu huỳnh quang hoặc phóng xạ. Sau khi lai, cường độ tín hiệu tại từng vị trí probe được đọc bằng máy quét chuyên dụng, phản ánh mức độ biểu hiện hoặc số bản sao của đoạn DNA mục tiêu trong mẫu.
Công nghệ microarray ra đời từ giữa thập niên 1990 và nhanh chóng trở thành công cụ chủ lực trong nghiên cứu biểu hiện gen (gene expression profiling), phát hiện đa hình đơn nucleotide (SNP genotyping) và phân tích bất thường số bản sao gen (array CGH). Ưu điểm nổi bật là khả năng xử lý cao (high-throughput), tiết kiệm thời gian và chi phí so với các phương pháp phân tích từng gen đơn lẻ.
Nguyên lý hoạt động
Probe DNA—thường là oligonucleotide dài 25–70 nucleotide hoặc các đoạn cDNA—được in hoặc tổng hợp in situ trên bề mặt chip. Số lượng probe có thể dao động từ vài ngàn đến hàng triệu, sắp xếp theo lưới với khoảng cách chuẩn, đảm bảo mỗi vị trí là một thử nghiệm lai độc lập.
Mẫu phân tích, bao gồm RNA (trước tiên chuyển ngược thành cDNA) hoặc DNA mẫu, được gắn nhãn huỳnh quang (Cy3, Cy5) hoặc các nhãn khác. Khi trộn mẫu đã gắn nhãn với dung dịch lai, các đoạn mục tiêu sẽ tìm và lai với probe có trình tự tương ứng trên vi mảng.
Sau giai đoạn lai và rửa để loại bỏ lai không đặc hiệu, vi mảng được quét bằng máy laser scanner. Máy quét kích thích các nhãn huỳnh quang và ghi lại hình ảnh số tại mỗi ô probe, sau đó phần mềm phân tích đo cường độ tín hiệu. Cường độ huỳnh quang tỷ lệ thuận với nồng độ hoặc mức biểu hiện gen mục tiêu trong mẫu.
Các loại microarray
Expression arrays được thiết kế để đo lượng mRNA hoặc cDNA từ mẫu tế bào, mô hoặc mẫu sinh học. Các probe thường đại diện cho exon hoặc toàn bộ gene, cho phép xây dựng biểu đồ mức độ biểu hiện gen trên quy mô toàn bộ hệ gen. Ứng dụng chính là so sánh mẫu bệnh và mẫu đối chứng để xác định gen khác biệt biểu hiện (NCBI Review).
Genotyping arrays tập trung vào phát hiện biến thể di truyền như đa hình đơn nucleotide (SNP), đa hình số bản sao (CNV) hoặc đột biến. Các probe trên array này được thiết kế đặc hiệu cho allele khác nhau, cho phép xác định nhanh hàng trăm nghìn SNP trong quần thể hoặc cá thể (Illumina Arrays).
Comparative Genomic Hybridization (CGH) arrays dùng để xác định bất thường trong số bản sao gen, ví dụ mất đoạn hoặc lặp đoạn trên nhiễm sắc thể. Mẫu DNA bệnh nhân và DNA tham chiếu được đánh dấu khác màu lai đồng thời lên vi mảng, so sánh cường độ tín hiệu để phát hiện thay đổi số lượng bản sao gen.
Quy trình chế tạo
Có hai cách chính để chế tạo microarray: in-situ synthesis và spotted arrays. Với in-situ synthesis, phương pháp photolithography (như Affymetrix) hoặc ink-jet printing (như Agilent) được sử dụng để tổng hợp trực tiếp oligonucleotide trên bề mặt chip qua các bước chiếu tia UV và tải khối xây dựng base.
Trong spotted arrays, probe oligo hoặc cDNA được chuẩn bị trước, sau đó dùng robot đánh giọt dung dịch probe lên bề mặt thủy tinh đã phủ chất keo chuyên dụng. Robot in mảng đảm bảo độ chính xác vị trí và khối lượng giọt probe, tạo ra lưới đều đặn hàng nghìn vị trí.
Quy trình sau in gồm bước cố định probe bằng nhiệt hoặc hóa chất, chặn bề mặt để ngăn lai không đặc hiệu, và kiểm tra chất lượng ban đầu bằng lai kiểm định với mẫu chuẩn. Chip thành phẩm được bảo quản khô, tránh ánh sáng mạnh để duy trì khả năng lai và tín hiệu huỳnh quang ổn định.
Gắn nhãn và lai mẫu
Gắn nhãn mẫu thử là bước then chốt để phát hiện tín hiệu lai trên microarray DNA. Với expression arrays, RNA tổng hợp ngược thành cDNA được đánh dấu huỳnh quang trực tiếp (Cy3, Cy5) hoặc gián tiếp thông qua amino-allyl, cho phép phân tích dual-color để so sánh hai mẫu đồng thời.
Trong genotyping arrays, DNA mẫu được kéo dài và gắn biotin rồi phát triển màu (streptavidin–phycoerythrin) để đọc bằng hệ thống detection. Độ đặc hiệu của lai phụ thuộc vào nhiệt độ và thời gian ủ, thường tối ưu ở 42–65 °C trong 12–24 giờ, sau đó rửa chu kỳ để loại bỏ lai không đặc hiệu.
- Đánh dấu trực tiếp: nhãn fluorophore gắn vào nucleotide trước khi lai.
- Đánh dấu gián tiếp: sử dụng kháng thể hoặc streptavidin để phát tín hiệu sau lai.
- Đồng lai (dual-color): so sánh mẫu điều trị (Cy5) và mẫu đối chứng (Cy3).
Phát hiện và quét mảng
Máy quét laser (microarray scanner) kích thích nhãn huỳnh quang tại bước sóng đặc trưng, thu nhận hình ảnh số với độ phân giải ≤ 5 μm/pixel. Mỗi ô probe được xác định vị trí tự động, phần mềm đo cường độ pixel trung bình và nền xung quanh.
Quy trình quét thường bao gồm:
- Chọn kênh huỳnh quang tương ứng (532 nm cho Cy3, 635 nm cho Cy5).
- Điều chỉnh PMT gain để tránh bão hòa tín hiệu.
- Thu ảnh RAW và lưu định dạng TIFF hoặc GPR cho phân tích tiếp theo.
Hiệu chuẩn máy quét định kỳ bằng slide chuẩn có cường độ biết trước giúp duy trì tính ổn định và độ tin cậy của dữ liệu huỳnh quang.
Phân tích dữ liệu
Phân tích dữ liệu microarray gồm ba bước chính: tiền xử lý, phân tích thống kê và trực quan hóa. Tiền xử lý bao gồm đọc file GPR, lọc probe chất lượng thấp, rút nền và chuẩn hóa xuyên mảng (e.g. RMA, quantile normalization) để loại bỏ biến thiên kỹ thuật.
Phân tích thống kê tập trung vào xác định gen khác biệt biểu hiện hoặc allele khác biệt tần suất. Với expression data, phương pháp t-test, ANOVA và phân tích phương sai (limma) thường được dùng. Clustering (hierarchical, k-means) và PCA giúp nhóm mẫu theo biểu hiện và khám phá mẫu tiềm ẩn.
Bước | Phương pháp | Công cụ |
---|---|---|
Tiền xử lý | RMA, quantile | Affymetrix Power Tools, Bioconductor |
Đánh giá khác biệt | t-test, limma | R (limma package) |
Clustering | Hierarchical, PCA | Cluster 3.0, Cytoscape |
Trực quan hóa kết quả qua heatmap, volcano plot và MA-plot giúp nhận diện gen mục tiêu và kiểm tra phân phối dữ liệu (Bioconductor).
Ứng dụng chính
Expression microarrays được sử dụng rộng rãi trong nghiên cứu bệnh lý ung thư để phân loại phân nhóm bệnh nhân, phát hiện biomarker và đánh giá đáp ứng điều trị. Ví dụ, phân tích biểu hiện 70 gen (MammaPrint) hỗ trợ dự báo tái phát vú (Nature).
Genotyping arrays hỗ trợ các dự án GWAS (Genome-Wide Association Studies) tìm liên kết giữa SNP và bệnh lý đa yếu tố như tiểu đường type 2, tim mạch. So sánh hàng nghìn SNP trên quy mô dân số lớn giúp xác định locus nguy cơ (Illumina).
- CGH arrays: phát hiện mất đoạn copy (microdeletion) trong hội chứng di truyền.
- Expression arrays: nghiên cứu pathway, phân tích tương tác gene-protein.
- Genotyping: lựa chọn giống cây trồng và vật nuôi qua marker-assisted selection.
Ưu điểm và hạn chế
Ưu điểm:
- High-throughput: phân tích đồng thời hàng nghìn mục tiêu.
- Chi phí thấp hơn so với NGS khi khảo sát gen đã biết.
- Dễ chuẩn hóa và quy chuẩn trên nền tảng thương mại.
Hạn chế:
- Phụ thuộc thiết kế probe, không phát hiện biến thể mới ngoài vùng probe.
- Độ nhạy & đặc hiệu thấp hơn NGS với đột biến hiếm.
- Giới hạn động học khi tín hiệu quá mạnh hoặc quá yếu gây bão hòa hoặc nhiễu nền.
Hướng phát triển tương lai
Microarray DNA đang được tích hợp với công nghệ sequencing (RNA-Seq) để xác thực kết quả và mở rộng phát hiện đột biến, đặc biệt trong transcriptome profiling. Sự kết hợp này tận dụng chi phí thấp của microarray và độ bao phủ toàn diện của NGS.
Các microarray thế hệ mới sử dụng microfluidic để giảm lượng mẫu và reagent, tăng khả năng tự động hóa và throughput. Mảng proteomic (protein microarrays) và methylation arrays mở rộng ứng dụng từ gene biểu hiện sang biểu hiện protein và methyl hóa DNA, hỗ trợ phân tích đa tầng hệ thống sinh học.
Xu hướng kết hợp AI và machine learning trong phân tích dữ liệu microarray giúp xây dựng mô hình dự báo chính xác hơn, tự động chọn gen marker và phát hiện pattern biểu hiện phức tạp.
Tài liệu tham khảo
- Schena, M., et al. (1995). Quantitative Monitoring of Gene Expression Patterns with a Complementary DNA Microarray. Science, 270(5235), 467–470.
- Sorlie, T., et al. (2001). Gene expression patterns of breast carcinomas distinguish tumor subclasses with clinical implications. PNAS, 98(19), 10869–10874.
- Lockhart, D. J., & Winzeler, E. A. (2000). Genomics, gene expression and DNA arrays. Nature, 405(6788), 827–836.
- NCBI. (2010). DNA Microarray Technology. ncbi.nlm.nih.gov/PMC2757112
- Illumina. (2025). Microarray Technology. illumina.com
- Bioconductor. (2025). Bioconductor Project. bioconductor.org
Các bài báo, nghiên cứu, công bố khoa học về chủ đề microarray dna:
- 1
- 2
- 3
- 4
- 5
- 6
- 9